搜索资源列表
lucene-1.4.3
- java实现的一个搜索引擎。只有检索引和查询功能,没有爬虫。是学习搜索引擎开发的好例子。-achieve a search engine. Only search and query primers, no reptiles. Learning is the development of the search engine are good examples.
MyCrawlerFrame
- java 开发的网页爬虫,使用广度搜索,对网页的所有链接进行查找,并分析其链接,找出一级域名的所有网址,并将其添加到待处理列表,站外链接只作记录,不作处理,软件有界面,src文件夹里面有源码,myCrawler.jar可直接运行-java development of the website reptiles, the use of search breadth of the website link for you all, and analysis of their link to find
websphinx-src
- 一个用java语言编写的网络爬虫程序,其中包含一个jar包,在装有jre的机器上可直接运行。-use a java language network Reptile procedures, which include a jar packs, jre installed in the machine can run.
java_crawler
- 利用java实现爬虫功能,并爬取b站视频(Use of Java to implement reptilian function)
demo
- 实现java网页爬虫功能,内容详细,包含了多个预留功能接口(accomplish the spider function and it's very copmpletely)
WebCrawler
- 对于我们当代的大学生来说,就业一直以来就是我们应届毕业生的一大难题,如何用最快的时间获取最有效的招聘信息,成为我们关注的焦点。 本课题正是为适应广大应届毕业生的需求,并分析了近几年内网络爬虫技术的研究和发展,对网络爬虫相关技术进行了分析与总结,使用Java语言、SQL Server数据库以及HTML的页面解析工具Jsoup,设计了一个简单的主题爬虫模块,最终实现了对河北师范大学就业信息网上现场招聘会的招聘信息的采集入库功能。(For our contemporary college stude
x
- 公司开发人员写的爬虫程序,基于GO语言的,最后公司采用JAVA的爬虫。。。。。。(The crawler program written by the company developers is based on the GO language. Finally, the company adopts the crawler of JAVA.)
thread
- 多线程小说爬虫,可以同时爬取多部小说,采用java编写(A novel multi-threaded crawler, can also take up many novels, written by Java)
dwgaqiredirected
- 一个Web爬虫Java类库,最初由Carnegie Mellon 大学的Robert Miller开发,()
HttpUtils
- java基于httpclient开发的网络爬虫通用实例,带登录后获取数据(Java based on httpclient development of a common example of web crawler, with login to obtain data)
wrddo
- 一个Web爬虫Java类库,最初由Carnegie Mellon 大学的Robert Miller开发,()
WebCollector
- java爬虫框架,在eclipse编程环境中,可以良好运行(Java reptilian frame)
zhihu-crawler-2.0
- 这是用java编程语言编写的一个关于知乎用户的爬虫。(This is a crawler about Zhihu users written in the Java programming language.)
WebCollector
- WebCollector爬虫框架源码,对于学习爬虫有很大的帮助(WebCollector crawler framework source code)
WebDriverTaoBaoJDBC
- 业余时间用java写了一个爬虫 ,下载淘宝产品(In my spare time, I wrote a crawler with Java, downloading Taobao products.)
PanChongTest
- 基于Java的简单的爬虫学习知识,讲解详细,适合初学者使用(Java based simple learning knowledge of spiders, explain in detail, suitable for beginners.)
布谷鸟算法应用到爬虫
- 使用matlab实现的布谷鸟算法,非常好用,需要的可以下载看看!(Voting management system, the use of Java language development, SSH framework, though difficult, but the function is very strong!)
webcollector-2.32-bin
- WebCollector是一个无须配置、便于二次开发的JAVA爬虫框架(内核),它提供精简的的API,只需少量代码即可实现一个功能强大的爬虫。(WebCollector is a JAVA crawler framework (kernel) that does not need to be configured and is easy to develop for two times. It provides a streamlined API that requires a small nu
Java爬虫软件
- Java爬虫软件,爬取网站的URL后保存到Mongo数据库里面,并记录哪些爬过了,哪些没爬
url
- 用JavaURL编程爬取并分析网页敏感词 1.编写界面,输入一个网址,能够爬取该网址上所有的HTML源代码。 2.对网址中的文本进行提取。 3.建立敏感词库,用文本文件保存。 4.将该网址所对应的文本中的敏感词提取并高亮显示。 5.编写文本文件,可以存入多个网址;程序可爬取这些网址中的文本内容,将敏感词记录存入另一个文件,格式自定。 6.编写一个主界面,整合上述功能。(Crawling and analyzing web sensitive words with Java URL program